iT邦幫忙

2023 iThome 鐵人賽

DAY 5
0
AI & Data

量化交易與機器學習系列 第 5

梯度提升機(Gradient Boosting Machine)模型預測公司關閉

  • 分享至 

  • xImage
  •  

GBM 模型可以預測未來幾年,以便管理層可以在預測關閉之前很久進行干預。
對變量非線性關係的更深入理解有助於改善陷入困境和運行良好的部門。

分類器的性能通過排列技術使用 ROC (AUC) 分數和模型的統計顯著性進行測量。
SHAP 值與排列的 p 值一起為我們提供了類似於線性模型效果的度量一種分類模型,旨在預測公司位置在一到兩年內是否會開業或關閉。

公司評級具有微觀經濟影響。
企業主、債權人、財務主管和投資者如何使用來自客戶的公司資料來決定哪些公司應該繼續營業,哪些公司應該關閉。

許多宏觀和微觀因素都可能導致公司倒閉。
增長、最低工資和競爭等宏觀因素,以及公司獲得資本、地理位置和整體業主能力等微觀因素,都可能發揮作用。

破產預測在金融通常使用線性預測模型和使用流動性、償付能力和盈利能力指標的財務因素分析。
公司破產或財務困境研究主要關注母公司,而不是單個地點/部門。

預測變量性能的傳統顯著性檢驗也被更高維度的分類樹和重要性度量所取代。
例如基尼重要性、資訊增益和SHAP 值。
這些都是以資料為中心的方法,它們根據所選變量及其在樹節點中的排名而不是顯著性檢驗來考察參數的預測能力。

模型中使用的一些權重會隨著時間的推移而累積。
因此,當將該模型應用於隨機樣本時,它可能會低估破產情況,從而在實踐中導致更多的假陰性。
這個問題可以通過簡單地對破產進行過採樣並重新訓練模型或調整決策閾值來緩解。

有多種方法可以用來逼進函數。
對於分類模型,可以使用邏輯回歸、神經網路和決策樹。
當今實踐中使用的最佳可解釋機器學習解決方案是梯度增強機(GBM),Microsoft 也創造了自己的實作,稱為 LightGBM。

https://chart.googleapis.com/chart?cht=tx&chl=%24%24%20acc(y%2C%5Chat%7By%7D)%20%3D%20%5Cfrac%7B1%7D%7Bn_%7Bsamples%7D%7D%20%5Csum_%7Bi%3D0%7D%5E%7Bn_%7Bsamples%7D-1%7D%201(%5Chat%7By%7D_i%20%3D%20y_i)%20%24%24

ROC 曲線下面積(Area Under the Curve, AUC)還是很重要的指標。
ROC 曲線是分類研究中流行的統計資料。
這種方法被廣泛使用,因為準確性在不平衡的資料上效果不佳,即失敗的公司比健康的公司少得多。


上一篇
恐慌指數(Volatility Index,VIX)策略
下一篇
集成學習(Ensemble Learning)和訊號理論(Signaling Theory)預測收益
系列文
量化交易與機器學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言